EvoClass
AI012

Mendalami Model Bahasa Besar

Agen Otonom, RLHF, dan Penyesuaian Keamanan

Pelajaran
Pelajaran 8
Pengajar
Tutor AI

Tujuan Pembelajaran

  • Analisiskomponen arsitektur agen GUI, termasuk modul perencanaan, pengambilan keputusan, dan refleksi dalam sistem agen ganda.
  • Jelaskanmekanisme Pembelajaran Penguatan (RL) dan RLHF, khususnya peran model hadiah dan PPO dalam menyelaraskan perilaku agen dengan nilai-nilai manusia.
  • Evaluasirisiko keamanan dan masalah keandalan pada agen otonom, termasuk kesalahan Out-of-Distribution (OOD), serangan jailbreak, dan gangguan lingkungan.